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摘 要 将 机 器 学 习 应 用 于 精神 疾患 的 临床 和 基础 研究 是 近年 来 的 趋势 。 研 究 者 将 机 器 学 


习 应 用 于 精神 分 裂 症 患者 及 高 危 人 群 的 T1 加 权 像 和 弥散 张 量 成 像 的 脑 影像 数据 中 ， 为 了 


解 疾 病 的 生理 病理 学 机 制 提 供 帮 助 。 回 顾 以 往 研 究 发 现 额 叶 及 矣 叶 的 脑 结 构 特 征 具 有 较 高 


的 区 分 能 力 ， 行 为 数据 和 脑 影像 数据 结合 的 分 类 效果 优 于 单 模 态 数据 。 现 阶段 研究 存在 样 
本 
从 而 进一步 探 完 机 器 学 习 在 精神 疾患 中 的 作用 。 
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量 不 足 和 泛 化 能 力 欠 缺 的 局 限 ， 未 来 研究 应 注意 扩大 样本 量 、 制 定 标 准 化 的 分 类 方法 ， 
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神 分 裂 症 是 一 种 严重 的 精神 障碍 ， 患 病 率 约 为 1% ， 患 者 表现 出 思维 方式 和 行为 举 
止 怪 异 、 感 知觉 扭曲 、 认 知 失 调 等 症状 并 且 常 伴 有 情感 迟钝 、 社 会 退缩 等 特征 
(Carpenter & Buchanan, 1994) 。 近 年 来 ， 研 究 者 利用 脑 影 像 技术 发 现 精神 分 裂 症 患者 的 脑 
结构 存在 异常 ， 包 括 灰 质 体积 和 密度 改变 ， 白 质 异 常 和 脑室 体积 增 大 等 ， 为 理解 精神 疾病 
的 病理 机 制 提供 支持 (Bakhshi & Chance, 2015; Palaniyappan, 2017) 。 现 阶段 精神 分 裂 症 
脑 影 像 研究 多 采用 临床 患者 和 健康 对 照 的 组 间 均 值 差 异 检验 来 考察 患者 的 异常 特征 ， 然 而 
这 一 方法 获得 的 结果 无 法 应 用 到 个 体 水 平 上 ， 机 器 学 习 (Machine Learning) 技术 可 以 弥 


补 以 上 不 足 。 机 器 学 习 这 一 概念 最 早 由 IBM (International Business Machines Corporation) 


公司 的 Arthur Samuel (1959) 提出 。 Tom Mitchell 提出 更 广泛 且 正 式 的 机 器 学 习 定 义 : 
“对 于 某 类 任务 工 和 性 能 度量 P ， 如 果 一 个 计算 机 程序 在 T 上 以 了 衡量 的 性 能 随 着 经 验 卫 
而 自我 完善 ， 那 么 称 这 个 计算 机 程序 在 从 经 验 卫 学 习 ” (Mitchell, 1997) 。 在 精神 疾病 领 
域 ， 研 究 者 利用 机 器 学 习 从 脑 影像 数据 中 学 得 规律 、 构 建 模型 并 利用 模型 在 个 体 水 平 上 进 
行 预测 ， 同 时 发 现 最 具有 鉴别 能 力 的 特征 。 

目前 已 经 有 研究 者 利用 机 器 学 习 分 类 方法 ， 尝 试探 讨 如 何 从 人 群 中 识别 出 精神 分 裂 症 


患者 (Ardekani et al., 2011; Nieuwenhuis et al., 2012; Winterburn et al., 2017) 、 从 高 危 人 群 


中 识别 出 未 来 转变 为 精神 分 裂 症 患者 的 个 体 (Zarogianni, Storkey, Johnstone, Owens, & 
Lawrie, 2017) 以 及 区 分 处 于 不 同 疾病 阶段 的 临床 患者 (Guo, Palaniyappan, Liddle, & Feng， 
2016) 。 在 训练 模型 的 过 程 中 ， 模 型 选取 的 特征 一 般 是 能 够 区 分 各 类 别 的 显著 特征 ， 因 此 
精神 分 裂 症 患者 、 高 危 人 群 和 健康 对 照 的 机 器 学 习 分 类 研究 可 以 为 精神 分 裂 症 的 疾病 诊断 、 
预后 判断 、 疗 效 判 断 相关 生物 标记 物 的 寻找 提供 帮助 。 

本 文 将 从 以 下 四 个 方面 进行 系统 论述 :首先 简要 阐述 机 器 学 习 的 主要 步骤 ， 其 次 
对 以 往 利用 脑 结构 像 对 精神 分 裂 症 患 者 及 高 危 人 群 开展 的 机 器 学 习 研 究 进行 系统 梳理 ， 
并 讨论 现 阶段 精神 分 裂 症 领域 机 器 学 习 研 究 的 局 限 ， 最 后 提出 未 来 研究 方向 。 


1 机 器 学 习 的 主要 步骤 


将 机 器 学 习 应 用 于 精神 分 裂 症 的 脑 结构 像 ” (structural Magnetic Resonance Imaging, 
SMRI) 数据 时 ， 主 要 步骤 包括 从 脑 影 像 中 提取 特征 数据 、 特 征 降 维和 特征 选择 、 训 练 模型 、 
评估 模型 以 及 利用 模型 预测 新 样本 〈 见 图 1 ) 。 
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“从 脑 影像 中 提取 特征 数据 ， 
例如 皮层 厚度 、 灰 质 体积 、 
白质 体积 等 
“将 样本 分 成 训练 集 、 验 证 集 
和 测试 集 


提取 数据 


数据 处 理 ; 特 | .降低 数据 的 维度 
到 “选择 最 能 区 分 类 别 的 特征 


训练 模型 


“寻找 样本 数据 的 规律 
“生成 分 类 模型 寞 型 不 完善 时 , 进行 调 参 等 


操作 ， 重 新 生成 模型 


“使 用 模型 预测 新 
样本 


图 1， 脑 影像 数据 的 机 器 学 习 分 析 步 又 


1.1 提取 数据 

在 精神 分 裂 症 的 脑 结 构 像 研究 中 ， 采 用 高 信 噪 比 的 大 脑 图 像 是 分 析 的 基础 。 研 究 者 应 
进行 图 像 质 量 控制 ， 以 保证 用 于 机 器 学 习 数 据 的 可 靠 性 和 有 效 性 。 从 脑 影像 中 提取 数据 后 ， 
数据 集 将 被 分 割 成 训练 集 和 测试 集 或 者 训练 集 、 验 证 集 和 测试 集 。 研 究 者 使 用 训练 集 数 据 
寻找 规律 、 生 成 模型 ， 利 用 验证 集 数 据 调 整 模型 参数 、 选 择 最 优 模型 ， 最 终 使 用 测试 集 数 
据 检验 最 终 模 型 的 性 能 。 


1.2 特征 降 维 和 特征 选择 

特征 降 维和 特征 选择 能 有 效 提 高 模型 的 泛 化 能 力 ， 是 数据 处 理 的 重要 步 又， 对 高 维 数 
据 的 处 理 尤 为 重要 。 特 征 降 维 是 高 维 数据 转变 成 低 维 数 据 的 过 程 ， 常 用 方法 是 主 成 分 分 析 
(Principal Components Analysis, PCA) 。 特 征 选择 是 从 原始 或 降 维 后 的 数据 中 选取 具有 最 佳 
分 类 效果 的 特征 子 集 的 过 程 ， 该 子 集 的 类 别 分 布 应 与 原始 数据 的 类 别 分 布 相似 。Guyon， 
Weston, Barnhill 和 Vapnik (2002) 基于 评价 准则 将 特征 选择 方法 分 为 过 滤 法 ”(Filter)、 包 装 


法 (Wrapper) MIRAIA (Embedded)， 三 类 特征 选择 方法 在 精神 分 裂 症 的 脑 影像 分 类 研 
究 中 均 有 应 用 。 过 滤 法 根据 特征 的 统计 指标 或 特征 与 类 别 之 间 的 相关 性 对 特征 进行 评分 ， 
根据 设 定 的 阔 值 或 设 定 的 个 数 选择 特征 ， 有 助 于 降低 特征 之 间 的 相关 性 ， 提 高 特征 与 类 别 
之 间 的 相关 性 。 包 装 法 是 根据 算法 的 分 类 性 能 增 减 特征 ， 如 使 用 基于 支持 向 量 机 的 递归 特 


征 消除 方法 (Support Vector Machine-Recursive Feature Elimination, SVM-RFE) 选择 特征 。 
嵌入 法 合并 特征 选择 和 分 类 器 训练 过 程 ， 在 训练 过 程 中 自动 选择 最 优 特征 子 集 ， 如 决策 树 
算法 在 训练 过 程 中 优先 选择 分 类 能 力 更 强 的 特征 。 除 此 之 外 ， 研 究 者 还 可 以 根据 以 往 文献 
选择 或 移 除 特征 ， 例 如 将 精神 分 裂 症 患者 受 药物 影响 较 大 的 纹 状 体 的 影像 数据 移 除 


(Nieuwenhuis et al., 2012) 。 


1.3 训练 模型 

研究 者 利用 机 器 学 习 算 法 寻找 脑 影 像 数 据 规律 并 生成 模型 。 机 器 学 习 算 法 一 般 分 为 监 
督学 习 和 无 监督 学 习 ， 区 别 在 于 算法 是 否 使 用 样本 数据 的 分 类 信息 或 目标 值 。 在 精神 分 裂 
证 的 研究 中 ， 研 究 者 通常 使 用 支持 向 量 机 (Support Vector Machine, SVM) 、 线 性 回归 


(Linear Regression) 等 监督 学 习 算 法 探究 精神 分 裂 症 患者 或 高 危 人 群 和 健康 对 照 的 分 类 问 
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1.4 评估 模型 和 利用 模型 预测 新 数据 
泛 化 能 力 是 指 模 型 适用 于 新 数据 的 能 力 ， 研 究 者 利用 性 能 度量 来 衡量 模型 泛 化 能 

评估 模型 优 务 ( 周 志 华 ，2016〉 。 在 精神 分 裂 症 的 研究 中 ， 正 确 紊 ” (Accuracy) 、 敏 感性 
(Sensitivity) 即 查 全 率 (Recall) 、 查 准 率 (Precision) 和 特异 性 ”(Specificity) 是 最 直观 
的 性 能 度量 。 正 确 率 是 判断 正确 的 样本 数 占 样本 总 数 的 百分比 。 敏 感性 指 所 有 阳性 样本 中 
真 阳性 样本 的 比例 。 查 准 率 指 真 阳 性 样本 占 判 定 为 真 的 样本 的 百分比 。 特 异性 指 真 阴性 样 
ræ 本 占 所 有 阴性 样本 的 百分比 。 根 据 性 能 度量 结果 ， 研 究 者 采取 更 改 算法 、 调 节 模 型 参数 等 
方法 调整 模型 。 最 终 模型 确立 后 ， 可 用 来 预测 新 数据 的 类 别 。 
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1.5 交叉 验证 

交叉 验证 是 特征 选择 、 参 数 调 整 和 最 终 模 型 检验 中 评估 模型 性 能 的 有 效 方法 ， 数 据 处 
理 操 作 《 如 特征 降 维和 特征 选择 ) 必须 嵌入 在 交叉 验证 中 。 开 折 交 叉 验 证 (K-fold cross 
validation, K-fold CV) 是 最 常见 的 交叉 验证 方法 ， 它 将 样本 分 为 K 份 ， 每 次 取 K-1 份 为 训 
练 集 ， 剩 下 1 份 为 测试 集 ， 将 平均 正确 率 作 为 最 终 预 测 结果 。 在 大 多 数 研究 中 ， 研 究 者 选 
择 使 用 5 折 或 10 折 交叉 验证 ， 也 可 根据 样本 大 小 和 数理 统计 标准 确定 K 值 (Dwyer, 
Falkai, & Koutsouleris, 2018)。 由 于 受到 样本 量 的 限制 ， 脑 影像 的 机 器 学 习 研 究 通 常 采用 K 


折 交 又 验 证 法 的 特殊 形式 一 一 留 一 法 (Leave One Out Cross Validation, LOOCV)， 其 K 
取样 本 总 数 N 。 留 一 法 虽然 简单 ， 但 具有 高 偏差 、 高 耗 时 等 缺点 。 

另外 ， 有 研究 者 建议 使 用 骨 套 交叉 验证 (Nested Cross Validation) (Madsen, Krohne, 
Cai, Wang, & Chan, 2018) 。 符 套 交叉 验证 包括 评估 模型 性 能 的 外 循环 和 用 于 选择 最 优 特征 、 
最 优 参数 的 内 循环 ， 令 小 样本 数据 集 能 够 采用 不 同 的 数据 来 评估 模型 和 选择 特征 、 调 整 参 
数 ， 最 大 程度 减少 偏差 ， 缓 解 小 样本 数据 的 可 用 性 问题 ， 提 高 评估 结果 的 可 信和 度 。 目 前 已 


有 多 篇 脑 影像 数据 机 器 学 习 研 究 使 用 舱 套 交叉 验证 方法 ”Borgwardt et al., 2013; Dyrba, 


Grothe, Kirste, & Teipel, 2015; Peng et al., 2017; Zarogianni et al., 2017) 。 


2 ”基于 脑 结构 特征 的 精神 分 裂 症 患者 与 健康 对 照 的 分 类 研究 
我 们 对 2010 年 以 来 精神 分 裂 症 领域 采用 脑 结构 像 数 据 (包括 T1 加 权 像 、 弥 散 张 量 成 


像 (Diffusion tensor imaging, DID ) 的 机 器 学 习 研 究 进行 文献 搜索 ， 使 用 的 数据 库 包括 


Web of Science, PubMed , Elsevier ， 采 用 的 关键 词 包括 “ structural MRI” , “ Machine 


“ce 


Learning” ， Support Vector Machine” , SVM , schizophrenia , “ high 


risk”, schizotype 以 及 “ voxel based morphometry”, VBM , “ grey matter” , “ gray 


matter’, DTI, “ diffusion tensor imaging” 的 不 同 组 合 。 表 1 中 列 出 截止 到 2019 年 1 月 17 
日 搜索 到 的 34 篇 文献 的 主要 方法 和 结果 。 

根据 分 类 特征 是 否 来 源 于 同一 模 态 ， 脑 影像 数据 分 为 单 模 态 数据 和 多 模 态 数据 。 为 控 
讨 上 述 两 种 数据 和 不 同 脑 结构 特征 对 精神 分 裂 症 脑 影 像 的 机 器 学 习 分 类 的 影响 ， 下 文 将 按 
照 基于 脑 结构 像 的 单 模 态 机 器 学 习 研 究 、 基 于 DTI 的 单 模 态 机 器 学 习 研究 、 多 模 态 机 器 学 
习 研 究 、 脑 影像 数据 和 行为 数据 相 结合 的 机 器 学 习 研 究 这 一 顺序 进行 综述 。 


2.1 基于 脑 结构 像 的 单 模 态 机 器 学 习 研 究 

基于 脑 结构 像 的 机 器 学 习 研 究 中 ， 最 常用 的 特征 包括 大 脑 灰 质 体 积 、 白 质 体 积 和 皮层 
厚度 。 在 这 些 研究 中 ， 以 慢性 精神 分 裂 症 患 者 、 首 发 精神 分 裂 症 患者 ， 以 及 精神 病 高 危 个 
体 为 对 象 的 分 类 研究 均 有 报道 。 从 机 器 学 习 的 分 类 表现 上 看 ， 现 有 研究 的 分 类 正确 率 在 
36.84% 到 98% 之 间 ; 在 特征 方面 ， 使 用 额 叶 、 颗 叶 的 脑 结构 特征 可 以 达到 较 高 的 正确 率 。 


2.1.1 精神 分 裂 症 


在 精神 分 裂 症 的 分 类 研究 中 ， 总 样本 量 最 小 值 为 39， 最 大 值 为 606 ， 多 数 研究 总 样本 
量 超 过 100 ; 分 类 正确 率 在 44.74% 到 98% 之 间 ; 研究 结果 指出 ， 额 上 回 、 额 中 回 、 额 下 
回 、 显 中 回 、 显 上 回 、 梭 状 回 、 海 马 、 模 前 叶 、 丘 脑 和 枕 叶 的 脑 结构 特征 具有 较 高 的 分 类 
正确 率 ; 算法 对 分 类 正确 率 的 影响 不 明显 ， 特 征 选择 方法 可 能 会 影响 分 类 表现 ， 相 同 特征 
对 于 不 同 病 程 患者 的 重要 性 有 差异 。 
精神 分 裂 症 患者 的 脑 结构 随 病 程 改变 ， 有 研究 者 采用 98 例 不 同 病 程 的 精神 分 裂 症 患 者 
和 83 例 健康 对 照 的 皮层 厚度 数据 进行 分 析 ， 去 除了 年 龄 和 性 别 对 皮层 厚度 的 影响 ， 使 用 基 
于 RBF (Radial Basis Function) 核 的 SVM 算法 进行 分 类 并 用 留 一 法 验证 ， 获 得 81.77% 的 
平均 分 类 正确 率 ， 77.55% 的 平均 敏感 性 和 86.75% 的 平均 特异 性 ， 进 一 步 研究 发 现 病 程 
小 于 两 年 的 患者 与 健康 对 照 的 分 类 正确 率 最 高 (96.3%， 特 异性 为 98.8% 、 敏 感性 为 
88%) ; 患者 尤其 是 长 病程 患者 的 里 叶 - 边缘 系统 和 额 叶 - 顶 叶 的 皮层 厚度 减少 ， 但 枕 叶 
皮层 厚度 增加 (Guo etal., 2016) 。 
在 分 类 过 程 中 ， 有 研究 者 提出 与 使 用 全 脑 灰 质 密度 数据 相 比 ， 利 用 特征 选择 方法 选取 


部 分 脑 区 的 灰质 密度 作为 特征 能 提高 分 类 正确 率 。 Chin, You, Meng, Zhou 和 Sim (2018) 使 


<> 


用 序列 感 兴趣 区 选择 方法 (sequential region-of-interest (ROI) selection) 在 64 个 脑 区 的 灰质 
密度 数据 中 选择 最 优 特征 ， 结 果 发 现 使 用 该 特征 选择 方法 可 将 84 个 精神 分 裂 症 患者 和 43 个 
健康 对 照 (训练 集 〉 的 分 类 正确 率 从 86.6% 提高 到 92.0% ， 将 57 个 精神 分 裂 症 患者 和 28 个 
健康 对 照 〈 测 试 集 ) 的 分 类 正确 率 从 83.5% 提高 到 89.4% ， 同 时 筛选 出 包含 7 个 ROI 的 最 
(S) EDATE, ARRE, MPE, SURE MEE MEE, A RAIA MUS. IRA 
研究 者 比较 不 同 特征 选择 方法 对 分 类 正确 率 的 影响 。 Nieuwenhuis A (2012) 采 用 基于 
体 素 的 形态 学 分 析 (Voxel-Based Morphometry, VBM) 提取 脑 结 构 像 每 个 体 素 的 灰质 密度 
数据 ， 用 线性 回归 去 除 年 龄 、 性 别 和 利 手 的 影响 ， 将 残 差 作为 原始 输入 数据 ,分别 采用 髓 
入 法 和 基于 先 验 知识 选取 特征 ， 前 者 使 用 SVM 算法 训练 模型 ， 选 取 权 重 绝 对 值 前 10% 的 
特征 作为 输入 特征 ， 后 者 基于 以 往 研究 去 除 受 药物 影响 的 纹 状 体 的 灰质 密度 ， 将 余下 脑 
的 灰质 密度 作为 输入 特征 。 使 用 线性 SVM 算法 在 239 个 被 试 ( 128 个 患者 和 111 个 健康 
对 照 ) 中 建立 模型 ， 使 用 留 一 法 交叉 验证 。 结 果 发 现 采 用 嵌入 法 选取 特征 建立 的 模型 具 
有 较 好 的 分 类 表现 : 71.4% 的 平均 正确 率 ，73.4% 的 平均 敏感 性 和 69.4% 的 平均 特异 性 ; 
最 后 在 277 个 被 试 ( 155 个 患者 和 122 个 健康 对 照 ) 的 数据 中 进行 验证 ， 得 到 70.4% 的 分 


由 
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类 正确 率 ，67.1% 的 敏感 性 和 73.8% 的 特异 性 ， 研 究 发 现 患 者 额 叶 、 蜂 上 回 和 海马 的 灰质 
密度 降低 ， 而 基底 神经 节 和 左 侧 枕 叶 灰质 密度 增加 。 

除了 使 用 不 同 的 特征 选择 方法 ， 研 究 者 还 探究 不 同 算法 对 分 类 正确 率 的 影响 ， 
Salvador 等 人 (2017) 使 用 127 个 健康 对 照 和 128 个 精神 分 裂 症 患 者 的 灰质 体积 探究 不 同 算 


法 的 分 类 性 能 。 该 研究 采用 的 算法 包括 Ridge, Lasso ， 弹 性 网 络 (Elastic Net) , LO 


范 数 正则 化 逻辑 回归 (LO Norm Regularized Logistic Regressions) ， 线 性 SVM ， 正 则 化 


判别 分 析 (Regularized Discriminant Analysis) ， 随 机 森林 (Random Forests) 和 高 斯 过 程 
分 类 (Gaussian Process Classifier) ， 发 现 使 用 这 八 种 算法 得 到 的 分 类 结果 并 无 较 大 差异 ， 
分 类 正确 率 在 ”74.1% 到 76% 之 间 。 

现 有 研究 不 仅 将 机 器 学 习 应 用 于 区 分 精神 分 裂 症 患者 和 健康 对 照 ， 而 且 还 尝试 区 分 不 
同 亚 型 精神 分 裂 症 患 者 。 有 研究 者 使 用 机 器 学 习 区 分 有 无 强迫 症状 的 精神 分 裂 症 患 者 ， 在 
23 例 无 强迫 症状 的 精神 分 裂 症 患 者 和 23 例 有 强迫 症状 的 精神 分 裂 症 患者 的 样本 中 发 现 中 央 
SM (包括 辅助 运动 区 ) 、 中 扣 带 回 (middle cingulate gyrus) 和 额 叶 - 皮层 下 


(fronto-subcortical) 区 域 的 灰质 密度 能 很 好 地 区 分 两 组 被 试 ， 正 确 率 达到 78.26% (Tas et 


al., 2018) 。 


2.1.2 首发 精神 分 裂 症 


因 受 到 病程 和 长 期 服用 药物 的 影响 ， 慢 性 精神 分 裂 症 患者 的 脑 结构 可 能 发 生 一 定 的 改 
变 ， 影 响 机 器 学 习 研 究 的 分 类 表现 。 首 发 精神 分 裂 症 患者 较 少 受到 药物 和 病程 的 干扰 ， 对 
这 一 群体 的 研究 有 利于 探讨 精神 分 裂 症 的 神经 病理 机 制 。 在 首发 精神 分 裂 症 患者 的 分 类 研 
究 中 ， 总 样本 量 最 小 仅 为 42， 最 大 达到 480 ; 分 类 正确 率 在 44.74% 与 96.7% 之 间 。 在 特 
下 方面 ， 额 叶 (如 额 上 回 、 额 中 回 和 额 极 等 ) 、 显 中 回 、 梭 状 回 和 舌 回 的 脑 结构 特征 能 提 
高 分 类 正确 率 。 

分 类 问题 是 研究 者 首要 关注 的 问题 ， 在 127 个 首发 患者 和 127 个 健康 对 照 的 分 类 研究 
中 ，Squarcina 等 人 (2017) 提取 68 个 感 兴趣 区 的 皮层 厚度 数据 ， 分 别 对 每 个 感 兴趣 区 应 用 
SVM 算法 ， 根 据 分 类 结果 选取 5 个 最 优 特征 ， 利 用 最 优 特征 建立 模型 ， 使 用 SVM 或 多 
核 学 习 (Multiple Kernel Learning, MKL) 算法 进行 训练 和 预测 ， 在 额 上 回 ， 额 中 回 咏 部 和 矣 


中 回 取得 85% 的 最 高 正确 率 。 


A 


在 首发 精神 分 裂 症 患者 中 有 研究 者 探究 了 不 同 算法 应 用 于 灰质 密度 和 皮层 厚度 数据 的 


分 类 表现 。 Winterburn 等 人 (2017) 使 用 逻辑 回归 (Logistic Regression, LR). SVM ( 包 


括 线性 SVM 和 SVM-RBF ) 和 线性 判别 分 析 (Linear Discriminant Analysis, LDA) 三 种 
算法 进行 分 类 ， 脑 结构 像 数据 包括 灰质 密度 和 皮层 厚度 ， 数 据 样本 包括 50 例 首发 精神 分 裂 
症 患 者 和 50 例 健康 对 照 ， 研 究 者 首先 将 样本 分 为 2/3 的 训练 集 和 1/3 的 测试 集 ， 应 用 线性 
SVM 算法 于 灰质 密度 数据 时 ， 分 类 正确 率 最 高 可 达 69.6% (敏感 性 77.8% ， 特 异性 


57.9% ) ; 使 用 SVM-RBF 算法 和 皮层 厚度 数据 进行 分 类 ， 最 高 分 类 正确 率 可 达 73.5% 


(敏感 性 58.8% ， 特 异性 88.2% ) 。 


2.1.3 高 危 人 群 


与 首发 精神 分 裂 症 患者 相 比 ， 识 别 高 危 人 群 与 探究 其 脑 结构 有 利于 解释 精神 分 裂 症 的 
发 生机 制 、 预 测 精 神 疾病 的 发 生 。 目 前 利用 脑 结 构 像 对 高 危 人 群 的 分 类 研究 较 少 ， 总 样本 
量 均 不 超过 50， 分 类 正确 率 在 36.84% 与 72% 之 间 。 其 中 ， 有 研究 者 使 用 灰质 体积 数据 和 
SVM 算法 对 25 名 高 危 个 体 和 25 名 健康 对 照 个 体 进行 分 类 ， 应 用 留 一 法 进行 交叉 验证 ， 获 
得 72% 的 分 类 正确 率 〈 敏 感性 68% ， 特 异性 76% ) ， 双 侧 海 马 、 海 马 旁 回 、 壳 核 、 额 上 回 、 
额 中 回 、 梭 状 回 和 项 下 小 叶 ， 左 侧 晒 下 回 、 右 侧 里 上 回 、 左 侧 攀 前 叶 和 左 侧 小 脑 等 区 域 具 


有 较 高 的 特征 权重 (Valli et al., 2016) 。 


一 


= 2.2 基于 弥散 张 量 成 像 的 单 模 态 机 器 学 习 研究 
弥散 张 量 成 像 是 另 一 种 常用 的 脑 结构 成 像 。 水 分 子 在 脑 中 受到 白质 纤维 (如 髓 精 和 轴 
突 膜 等 的 约束 ， 各 个 方向 上 的 弥散 不 同 ， 呈 现 各 向 异性 。 弥 散 张 量 成 像 利 用 水 分 子 弥 散 
的 各 向 异性 成 像 ， 用 于 探究 脑 白 质 纤 维 束 的 位 置 和 方向 (Meoded, Poretti, Mori, & Zhang, 
2017) 。 现 有 基于 DTI 的 机 器 学 习 分 类 研究 较 少 ， 样 本 量 在 42 到 154 之 间 ， 研 究 常 采用 的 
特征 包括 各 向 异性 分 数 «(Fractional Anisotropy, FA) 、 轴 向 弥散 张 量 (Axial Diffusivity, 
AD)、 垂 直 弥 散 张 量 ”(Radial Diffusivity, RD) 、 平 均 弥 散 率 ”(Mean Diffusivity, MD) 等 ， 
从 机 器 学 习 的 分 类 表现 上 看 ， 现 有 研究 的 分 类 正确 率 最 低 为 60%， 最 高 可 达 98%。 
研究 者 将 50 名 精神 分 裂 症 患者 和 50 名 健康 对 照 分 为 训练 集 和 测试 集 ， 基 于 DTI 数据 
计算 FA 和 MD 值 ， 使 用 PCA 降 维 并 在 数据 中 进行 独立 样本 t 检验 ， 移 除 P 值 大 于 0.5 的 


特征 ， 利 用 Fisher 线性 判别 分 析 训 练 模型 。 结 果 发 现 使 用 FA 值 构建 的 模型 在 测试 集中 获 
得 94% 正确 率 〈 敏 感性 96% ， 特 异性 92% ) ， 有 区 分 能 力 的 特征 集中 在 大 脑 深 部 白质 区 域 ， 
WNA E (external capsule) ; 使 用 MD 值 构建 的 模型 在 测试 集中 的 正确 率 为 98% CAL 
感性 96%， 特 异性 100% ) ， 影 响 正确 率 的 特征 集中 在 皮层 和 脑室 ， 结合 FA 和 MD 数据 
进行 分 类 并 没有 显著 改变 模型 的 分 类 正确 率 〈 正 确 率 、 敏 感性 和 特异 性 均 为 96% ) 
(Ardekani et al., 2011) 。 

另外 ， 有 研究 者 基于 DTI 数 据 计 算 18 条 主要 白质 纤维 束 的 FA MD, RD 和 AD 值 ， 
使 用 基于 随机 森林 的 递归 特征 消除 法 (Random Forest-Recursive Feature Elimination, RF- 
RFE) 选择 特征 ， 采 用 随机 森林 算法 在 52 个 首发 患者 和 48 个 健康 对 照 的 数据 中 进行 训练 和 
测试 ， 得 到 71% 的 分 类 正确 率 〈 敏 感性 67.3% ， 特 异性 75% ) ; 用 最 终 模 型 区 分 13 个 首发 


患者 和 12 个 健康 对 照 得 到 76% 的 分 类 正确 率 〈 敏 感性 76.9% ， 特 异性 75%) ， 上 有 具有 区 分 能 


力 的 特征 位 于 连 合 纤 维 、 小 脑 - 丘脑 - 皮层 回路 (the cerebello-thalamo-cortical circuits) 
和 长 纤维 ”(Deng etal., 2019) 。 

Pettersson-Yeo 等 人 (2013) 利 用 FA 值 分 别 对 19 个 高 危 个 体 和 23 个 健康 对 照 、19 个 首 
发 患者 和 23 个 健康 对 照 进 行 分 类 ， 使 用 SVM 算法 均 得 到 65.79% 的 分 类 正确 率 ， 其 敏感 
性 均 为 68.42% ， 特 异性 均 为 63.16% 。 


2.3 基于 多 模 态 脑 影像 数据 的 机 器 学 习 研究 

除了 单 模 态 数据 ， 现 有 研究 还 尝试 结合 多 种 模 态 脑 影像 数据 对 精神 分 裂 症 患者 或 高 危 
人 群 与 健康 对 照 进 行 分 类 。 目 前 多 模 态 脑 影 像 机 器 学 习 分 类 研究 有 8 篇 ， 总 样本 量 在 46 到 
144 之 间 ， 分 类 正确 率 在 54.9% 到 100% 之 间 ， 常 与 TI 加 权 像 数据 结合 的 脑 影像 数据 有 


静 息 态 功 能 磁 共 振 成 像 ”(resting state functional Magnetic Resonance Imaging, rs-fMRI) 数据 
和 DTI 数 据 。 

Peruzzo 等 人 (2015) 结 合 Tl 加 权 像 和 DTI 数 据 ， 采 用 非 参数 统计 检验 和 SVM 算法 
选取 特征 ， 采 用 多 核 学 习 MKL 算法 对 23 个 首发 精神 分 裂 症 患者 和 23 个 健康 对 照 进行 分 类 ， 
正确 率 最 高 达到 93.5% ， 影 响 正确 率 的 特征 包括 杏仁 核 、 额 上 回 、 额 下 回 、 苍 白 球 、 海 马 
旁 回 的 灰质 体积 和 侧 脑 室 体积 ， 额 上 回 、 额 中 回 、 额 下 回 、 梭 状 回 、 海 马 旁 回 、 显 中 回 、 
眶 额 皮层 和 脑 岛 的 皮层 厚度 ， 多 束 、 扣 带 、 小 脑 下 角 和 腾 孚 体 压 部 的 弥散 张 量 值 。 此 外 ， 


Sui 等 人 (2013) 提出 一 种 多 模 态 融合 的 方法 一 一 mCCA (multi-set Canonical Correlation 


Analysis) 和 jICA (joint Independent Component Analysis) ， 将 rs-fMRI 、 结 构 像 和 DTI 的 
数据 两 两 结合 ， 对 35 名 精神 分 裂 症 患者 和 28 名 健康 对 照 个 体 进行 分 类 ， 发 现 单 模 态 数据 的 
分 类 正确 率 在 50%~70% 之 间 ， 多 模 态 数据 正确 率 在 60%~80% 之 间 。 另 外 ， 该 研究 团队 


分 类 
还 基于 rs-fMRI 、 T1 加 权 像 和 脑 电 数据 (Electroencephalogram , EEG) 采用 独立 样本 


t 检验 ，mCCA 和 SVM-RFE 选择 特征 ， 应 用 SVM 算法 和 十 折 交 叉 验 证 方法 在 43 个 精神 
分 裂 症 患者 和 48 个 健康 对 照 中 得 到 91% 的 分 类 正确 率 ， 并 且 以 100% 的 正确 率 成 功 区 分 5 
个 精神 分 裂 症 患者 和 5 个 健康 对 照 个 体 (Sui et al., 2014) 。 

虽然 现 阶段 大 部 分 多 模 态 脑 影 像 的 机 器 学 习 研 究 分 类 正确 率 较 高 ， 但 此 类 研究 的 样本 


量 通 常 较 小 。 因 此 ， 多 模 态 脑 影像 数据 对 分 类 结果 的 影响 仍 需要 进一步 探讨 。 


2.4 脑 影像 数据 和 行为 数据 相 结 合 的 机 器 学 习 研 究 

余 结 合 不 同 模 态 的 脑 影像 数据 以 外 ， 目 前 也 有 将 脑 影 像 数 据 和 行为 数据 相 结 合作 为 分 
类 特征 的 机 器 学 习 研究 ， 现 有 研究 建议 将 脑 影 像 数 据 和 行为 数据 结合 能 提高 分 类 正确 率 。 
有 研究 将 灰质 、 白 质 、 脑 硝 液 体积 与 威斯康星 卡片 分 类 测试 (Wisconsin card sorting 
test, WCST) 的 错误 率 结合 ， 利 用 独立 成 分 分 析 处 理 数据 ， 使 用 SVM 算法 在 19 个 精神 
分 裂 症 患者 和 16 个 健康 对 照 的 数据 中 取得 91.58% 的 分 类 正确 率 ， 证 明 WCST 的 错误 率 和 
脑 影像 数据 结合 能 有 效 区 分 患者 和 健康 对 照 。 (Chu, Huang, Jian, Hsu, & Cheng, 
2016) 。 Zarogianni 等 人 (2017) 预测 34 名 有 具有 家 族 遗 传 史 的 高 危 个 体 是 否 会 转变 为 精神 分 


裂 症 患者 ， 应 用 SVM-RFE 算法 在 各 脑 区 的 灰质 密度 数据 、 Rust Inventory of Schizotypal 


Cognitions (RISC) 问卷 分 数 和 雷 氏 听觉 语言 学 习 测 验 (Rey Auditory Verbal Learning Test, 


RAVLT) 得 分 中 进行 特征 选择 ， 用 SVM 算法 进行 预测 ， 分 类 正确 率 达 到 94% ， 高 于 仅 使 
用 灰质 密度 数据 的 分 类 正确 率 (88%) 。Ebdrup 等 人 (2018) 对 46 个 首发 精神 分 裂 症 患者 和 
58 个 健康 对 照 进行 分 类 ， 结 合 行为 数据 (包括 韦 氏 智力 量 表 第 三 版 和 丹麦 成 人 阅读 测试 
(Danish Adult Reading Test) ) 和 T1 加权 像 、DTI 和 EEG 的 数据 仅 获得 51%~68% 的 分 类 
正确 率 ， 低 于 仅 使 用 认 知 数据 的 分 类 结果 (60%~69%)， 稍 高 于 单独 使 用 单 模 态 数据 的 分 
类 结果 (49%~56%)。 因 此 ， 现 有 研究 提示 结合 行为 数据 和 脑 影像 数据 的 分 类 结果 可 能 优 


于 单 模 态 数据 的 分 类 结果 ， 但 结合 这 两 类 数据 能 否 取 得 高 正确 率 仍 有 待 进一步 探讨 。 
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图 2 精神 分 裂 症 患者 、 高 危 人 群 基于 脑 结构 像 分 类 研究 的 总 样本 量 和 分 类 正确 率 。SCZ: 精神 分 裂 症 ;，HC: 健康 对 照 ; 


100 


200 


@SCZ vs HC 最 高 分 类 正确 率 
9 SCZ vs HC 最 低 分 类 正确 率 


30 400 


”总 样本 量 


FEP vs HC 最 高 分 类 正确 率 
口 FEP vs HC 最 低 分 类 正确 率 


500 


AHR vs HC 最 高 分 类 正确 率 
AHR vs HC 最 低 分 类 正确 率 


600 


FEP: 首发 精神 


DRIE; HR: 高 危 人 群 。 实 心 点 代表 最 高 分 类 正确 率 ; 空心 点 代表 最 低 分 类 正确 率 ; 虚线 连接 同一 研究 中 相同 样本 量 的 最 高 与 最 低 分 
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类 正确 率 。 
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3 ”机 器 学 习 研 究 的 局 限 


将 机 器 学 习 应 用 于 精神 分 裂 症 


健康 对 照 进行 分 类 ， 


3.1 样本 量 


领域 ， 利 用 脑 结构 特征 对 精神 分 


有 助 于 理解 疾病 的 生理 病理 机 制 。 研 究 数量 逐 
局 限 ， 特 别 是 在 研究 样本 量 和 模型 泛 化 能 力 上 仍 存在 问题 ， 政 待 解 ; 


图 2 总 结 了 现 有 精神 分 裂 症 和 高 危 人 群 中 机 器 学 习 研 究 采 用 的 


高 和 最 低 正 确 率 。 如 图 2 所 示 ， 样 本 量 在 50 到 150 时 ， 最 高 分 类 正 


400 时 ， 最 高 正确 率 只 


情况 可 能 有 如 下 原因 : 


类 正确 率 ， 即 使 在 小 样本 测试 中 得 到 高 正确 率 仍 难以 验证 


验证 一 个 模型 的 有 效 性 至 少 需要 


Krafft, & Popp, 2013); 


J 60%~72% 。 出 现 小 样本 分 类 正确 率 高 而 
1) 样本 量 小 导致 模型 不 稳定 和 测试 不 准确 。 训 练 样本 量 过 小 容易 
导致 训练 不 充分 ， 造 成 模型 过 拟 合 或 不 稳定 ; 


测试 样本 量 过 小 ， 容 


75 到 100 个 测试 样本 
2 ) 现 有 大 样本 研究 的 分 类 特征 远大 于 样本 
选择 ， 容 易 造 成 模型 过 拟 合 ， 降 低 分 类 正确 率 ; 


个 模型 


(Beleite 


) 裂 症 串 者、 高 危 人 群 与 
年 递增 ， 但 仍 具 有 一 定 


总 样本 量 以 及 分 类 的 最 
确 率 较 高 ， 样 本 量 大 于 
大 样本 分 类 正确 率 低 的 


易 出 现 过 高 或 过 低 的 分 
的 性 能 。 有 研究 表明 ， 


s, Neugebauer, Bocklitz, 


3 ) 大 样本 研究 数 


的 异 质 性 可 能 更 高 ， 从 而 降低 分 类 正确 率 。 


2018) 。 样 本 量 不 足 的 主要 原因 


样本 量 不 足 是 现 阶 段 精神 分 裂 症 领 域 机 器 学 习 研 究 面 临 的 一 大 问题 
包括 磁 共 振 扫描 成 本 高 、 精 神 分 裂 症 的 特殊 性 和 数据 共享 


困难 。 高 昂 的 磁 共 振 成 像 扫描 费 / 


HH 


较 小 。 除 此 之 外 ， 多 中 心 数据 共享 困难 是 也 是 可 能 的 原因 之 一 ， 各 


和 较 长 的 扫描 时 间 导 致 研究 者 难以 在 短 时 间 内 收集 大 量 
脑 影像 数据 。 精 神 分 裂 症 患 者 受到 临床 症状 和 药物 副作用 的 影响 ， 在 采集 脑 影像 数据 时 需 
要 耗费 更 多 的 人 力 和 物力 ， 采 集 难度 大 ， 因 此 与 精神 分 裂 症 各 


TRIN 


BASAL, FARE 


、 伦 理 和 隐私 保护 的 问题 。 


未 来 多 个 研究 机 构 / 中 心 可 以 通过 制定 详细 协议 保障 被 试 隐私 


参数 和 入 组 标准 ， 在 不 违背 伦 到 


， 研 究 中 未 进行 特征 
据 来 自 多 个 中 心 ， 患 者 


a 


(Madsen et al., 


ul 


脑 成 像 研究 样本 量 通 
中 心 扫描 仪器 的 型 号 和 


和 数据 安全 ， 统 一 扫描 


的 情况 下 实现 多 中 心 数据 共享 ， 增 大 样本 量 。 研 究 者 在 纳 


入 多 中 心 数 据 时 ， 需 要 保证 入 组 标准 尽 可 能 一 致 ， 在 处 理 大 样本 数据 时 ， 进 行 数据 清洗 ， 


利用 降 维 和 特征 选择 的 方法 保留 有 
用 大 样本 数据 考察 脑 结构 特征 的 


量 问题 。 研 究 者 分 别 在 4 个 中 心 | 


用 特征 ， 保 证 数据 质量 ， 得 到 更 
了 效 性 。 有 研究 者 提出 可 以 通过 合 
改 集 首发 精神 分 裂 症 患者 和 健康 对 


使 用 4 个 中 心 的 数据 训练 模型 ， 利 用 这 4 个 模型 生成 最 终 的 元 模型 
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加 可 信 的 结果 ， 从 而 利 
并 多 中 心 模型 解决 样本 
照 的 脑 结构 数据 ， 分 别 


(the meta-model). 4 


究 发 现 该 元 模型 与 基于 所 有 数据 生成 的 模型 有 较 高 的 相似 性 (Dluhoš et al., 2017) 。 因 此 ， 
合并 多 中 心 模型 为 解决 样本 无 法 共享 提供 了 一 种 新 思路 。 


3.2 泛 化 能 力 

机 器 学 习 的 目标 是 使 训练 得 到 的 模型 能 够 很 好 地 适用 于 新 样本 ， 即 具有 较 好 的 泛 化 能 
力 。 除 了 样本 量 不 足 会 影响 模型 泛 化 能 力 外 ， 机 器 学 习 训练 过 程 中 出 现 信息 泄露 也 会 影响 
泛 化 能 力 。 常 见 的 信息 泄露 的 情况 是 使 用 同一 批 样本 调整 参数 和 测试 结果 ， 在 特征 选择 时 
提前 使 用 测试 集 的 标签 ， 如 在 所 有 样本 中 进行 独立 样本 t 检验 选取 显著 脑 区 ， 再 进行 训练 
集 、 测 试 集 和 验证 集 的 拆 分 。 提 前 使 用 测试 集 的 信息 ， 虽 然 能 得 到 高 正确 率 ， 但 是 不 能 
映 模型 真正 的 泛 化 能 力 。 研 究 者 在 今后 研究 中 应 避免 信息 泄露 并 使 用 肉 套 交叉 验证 
(Madsen et al., 2018; Dwyer et al., 2018) ， 使 评估 结果 更 加 精确 ， 提 高 模型 泛 化 能 力 。 为 测 
试 泛 化 能 力 ，Dwyer 等 人 (2018) 建议 未 来 可 设置 第 三 方 检 测 机 构 ， 收 集 各 中 心 或 机 构 的 数 
据 ， 一 旦 形成 新 模型 ， 研 究 者 可 移交 第 三 方 机 构 ， 利 用 其 数据 进行 测试 ， 从 而 保证 较 好 的 


泛 化 能 


4 未 来 研究 展望 
未 来 的 精神 分 裂 症 脑 影像 机 器 学 习 研 究 可 以 考虑 在 特征 中 加 入 用 药 情况 、 临 床 症状 和 


社会 人 口 学 等 信息 。Kambeitz 等 人 (2015) 在 精神 分 裂 症 患者 和 健康 对 照 的 脑 影 像 机 器 学 习 
研究 中 ， 将 特异 性 和 敏感 性 作为 效应 量 ， 考 察 年 龄 、 阳 性 症状 与 阴性 症状 比率 、 抗 精神 病 
= 药物 剂量 对 分 类 结果 的 影响 。 该 元 分 析 发 现 ， 年 龄 越 大 机 器 学 习 分 类 的 敏感 性 越 高 ， 阳 性 
O 症状 与 阴性 症状 比率 越 大 特异 性 越 高 ， 抗 精神 病 药 物 剂 量 越 大 特异 性 越 高 。 因 此 ， 在 区 分 
不 同 病 程 的 患者 或 探究 预后 情况 时 ， 可 以 纳入 临床 信息 和 社会 人 口 学 信息 ， 提 高 分 类 表现 。 

近年 来 ， 随 着 计算 机 技术 的 高 速 发 展 ， 深 度 学 习 开 始 重 新 获得 人 们 关注 。 深 度 学 习 是 
以 人 工 神 经 网 络 为 架构 ， 对 数据 进行 表征 学 习 的 算法 ， 在 图 像 、 视 频 、 语 音 等 多 个 领域 均 


表现 优异 (Bengio, Courville, & Vincent, 2013; Lecun, Bengio, & Hinton, 2015; Schmidhuber, 


2015) 。 Pinaya A (2016) 使 用 深度 信念 网 络 ”(Deep Belief Network) ， 在 143 例 精神 分 
裂 症 患 者 和 83 例 健康 对 照 中 得 到 了 73.6% 的 分 类 正确 率 ( 敏 感性 76.37% ， 特 异性 
70.74% ) ， 稍 高 于 使 用 SVM 算法 的 正确 率 ( 68.1% ) 。 Dwyer 等 人 (2018) 指 出， 深度 
学 习 需 要 大 样本 数据 来 避免 维度 灾难 和 过 拟 合 。 因 此 ， 研 究 者 可 以 在 获得 大 样本 数据 的 基 
础 上 ， 尝 试 使 用 深度 学 习 的 方法 进行 分 类 ， 探 究 精 神 分 裂 症 的 内 在 机 制 。 


= 
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现 有 研究 的 数据 处 理 流 程 和 结果 报告 都 不 相同 ， 由 于 缺乏 具体 信息 和 使 用 方法 的 差异 ， 
不 同 研究 之 间 很 难 进行 比较 。 据 此 Riley(2019) 指 出 将 机 器 学 习 应 用 于 不 同学 科 领 域 中 时 ， 
应 建立 统一 的 数据 分 析 和 结果 报告 标准 。 


TE 


总 结 

i HL BASLBOR ASU ERRARE, TUIR RA ENEKEN, RA 
精神 分 裂 症 的 特点 和 内 在 机 制 ， 帮 助 寻找 生物 标记 物 、 实 现 精神 疾病 的 早期 识别 。 本 文 主 
要 从 脑 结 构 像 出 发 ， 综 述 了 单 模 态 、 多 模 态 脑 影像 和 结合 行为 数据 与 脑 影像 的 机 器 学 习 研 
究 。 单 模 态 脑 影像 的 机 器 学 习 分 类 正确 率 在 36.84% 到 98% 之 间 ， 多 基于 TL 加 权 像 ， 结 
果 提 示人 额 叶 和 里 叶 的 脑 结 构 特 征 可 以 有 效 区 分 精神 分 裂 症 患者 或 高 危 人 群 和 健康 对 照 ; 基 
于 DTI 的 机 器 学 习 研 究 多 采用 弥散 张 量 值 为 特征 ， 但 因 其 样本 量 小 且 现 有 研究 少 ， 各 研究 
者 提出 的 能 提高 分 类 正确 率 的 脑 区 或 纤维 特征 大 不 相同 ， 尚 未 达成 统一 意见 。 多 模 态 脑 影 
像 的 分 类 正确 率 在 54.9%~100% 之 间 ， 多 数 研究 的 分 类 正确 率 高 ， 但 样本 量 小 ， 多 模 态 数 
据 是 否 显著 优 于 单 模 态 数据 并 有 效 提高 分 类 正确 率 ， 有 待 研究 者 进一步 探讨 。 行 为 数据 和 
脑 影像 数据 结合 的 分 类 效果 优 于 单 模 态 数据 的 分 类 效果 ， 但 能 否 显 著 提 高 分 类 正确 率 仍 待 
进一步 验证 。 目 前 精神 分 裂 症 领域 的 机 器 学 习 研 究 具 有 样本 量 不 足 和 泛 化 能 力 弱 等 局 限 ， 
未 来 还 需要 在 多 中 心 的 大 样本 中 进行 模型 训练 和 验证 ， 以 求 获 得 更 可 靠 的 模型 和 更 有 效 的 
特征 ， 才 能 在 临床 实践 中 发 挥 更 大 作用 。 
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表 1 文献 总 结 
作者 样本 量 模 态 算法 特征 选择 交叉 验证 正确 率 


Greenstein, Malley, SCZ(98) HC(99) T1 RF 73.7% 


Weisinger, Clasen, & 


Gogtay, 2012 


Iwabuchi, Liddle, & SCZ(19) HC(20) T1 Linear SVM 留 一 法 63.9%~77% 


Palaniyappan, 2013 


Gould et al., 2014 CD(74) CS(126) Tl Linear SVM 


Leave-2-out HC vs CD: 64%~72% 


HC(134) HC vs CS:  59%~67% 
CD vs CS: 54%~59% 


HC vs SCZ :  59%~68% 


Lu et al., 2016 SCZ(41) HC(42) TI SVM SVM-RFE 留 一 法 79.5%~88.4% 


Chin et al., 2018 训练 集 : T1 SVM sequential ROI selection 训练 集 : 
SCZ(84) HC(43) algorithm 86.6%~92% 
测试 集 : 测试 集 : 
SCZ(57) HC(28) 83.5%~89.4% 


Takayanagi, Y. et.al., FEP(52) HC(40) Tl LDA 81.2%~96.7% 
2011 


Dluhoš et al., 2017 FEP(258) Tl SVM 留 一 法 52%~66% 
HC(222) 
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Xiao et al., 2017 FEP(163) Tl Linear SVM 两 样本 t (p<0.05) 十 折 交 叉 验 证 81.8%~85.0% 
HC(163) 


de Moura et al., 2018 FEP(32) chronic T1 MLDA 留 一 法 SCZ vs HC : 73.0% 
SCZ(143) FEP vs HC : 59.4% 
HC(32) sensitivity 


Rathi Y. et. al., 2010 FEP(21) HC(20) DWI Parzen window classifier, KNN, 69%~86% sensitivity 


SVM 68%~85% specificity 


Deng et al., 2019 训练 集 : DTI RF RF-RFE 留 一 法 训练 集 ， 71.0% 
FEP(52) HC(48) 测试 集 : 76.0% 
测试 集 : 

FEP(13) HC(12) 
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Sui et al., 2014 


Qureshi, Oh, Cho, Jo, 


& Lee, 2017 


Tas et al., 2018 


Peruzzo et al., 2015 


Lu et al., 2018 


Valli et al., 2016 


Karageorgiou, E., et. 


al., 2011 


Chu et al., 2016 


Ebdrup et al., 2018 


WAS 
SCZ(43) HC(48) 
WRG 

SCZ(5) HC(5) 


mt 


mt 


SCZ(72) HC(72) 


SCZ(23) schizo- 


obsessive (23) 


FEP(23) HC(23) 


FEP(44) chronic 


SCZ(44) HC(56) 


HR(25) HC(25) 


SCZ(28) HC(47) 


SCZ(19) HC(16) 


FEP(46) HC(58) 


DTI 

rs-fMRI 
T1 

rs-fMRI 


EEG 


rs-fMRI 


T1 


Neuropsychological 


T1 

the error rate of the WCST 
Cognition data(DART,WAIS IID 
T1 


Linear SVM 


SVM(RBF/Linear), ELM, LDA, RF 


SVM-RBF 


SVM, MKL 


SVM 


Linear SVM 


stepwise LDA 
PCA-LDA 


SVM 


naive Bayes, LR, SVM, decision 


tree, RF, auto-sklearn 
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mCCA, 两 样本 t 检验 ， 
SVM-RFE 


ACO 


非 参数 统计 检验 (p<0.05)+ 结 合 
SVM 选 特征 


SVM-RFE 


Wilk’s A(p=0.05 保留 ”,p=0.10 
删除 ) 


反 向 特征 消除 


十 折 交 又 验 证 


10 次 十 折 交 叉 验 证 


TRB AC MIE h 
六 折 交 又 验证 
五 折 交 叉 验 证 
留 一 法 


VY 


留 一 法 


NI 


内 层 : 


a BRAS: =~ (60%~80%) 


训练 集 ; 

单 模 态 : 66%~93% 
”多 模 态 : (280%)~91% 

测试 集 : 


单 模 态 : ”50%~90% 
多 模 态 : ”80%~100% 
单 模 态 : 42.4%~93.0% 
多 模 态 :54.9%~99.3% 


78.26%~93.48% 


a 多 模 态 : S 85% 


54%~72% 


单 模 态 : 70.7%~72% 


神经 心理 和 脑 影 像 数 据 : 


76%~92% 


82.794%~91.575% 


单 模 态 : 49%~56% 
认 知 数据 和 影像 数据 : 


DTI 51%~68% 


EEG 
Pettersson-Yeo et al., UHR(19) Tl SVM es UHR vs HC : 
2013 FEP(19) HC(23) DTI 36.84%~68.42% 
fMRI UHR vs FEP : 
Molecular genetics 33.33%~76.67% 
Neuropsychology HC vs FEP : 
44.74%~68.42% 
Zarogianni et al., 2017 HR{ill](17) Tl SVM SVM-RFE BS IE Gha: 单 模 态 : 88% 
HR[symp](17) behavioural data(RISC score, 留 一 法 , AE: 留 行为 和 影像 数据 : 94.1% 
RAVLT score) =) 
SCZ : 精神 分 裂 症 患者 ， HC: 健康 对 照 ， FEP : 首发 精神 分 裂 症 患者 ， UHR: 超 高 危 人 群 ，HR: 高 危 人 群 ， 其 中 ， HR[ill] 是 转变 为 精神 分 裂 症 的 高 危 人 群 ， HR[symp] 是 未 转变 为 精神 分 裂 症 的 
mic RE; BD: 躁 郁 症 患 者 ; DTI: 弥散 张 量 成 像 ， T1 : TIJA; DWI: diffusion weighted imaging (弥散 加 权 成 像 》; fMRI: 功能 性 磁 共振 成 像 ， rs-fMRI 为 静 息 态 功能 性 磁 共 振 成 像 ; 
EEG : 脑 电 波 ， 反 向 特征 消除 : backwards elimination feature selection ; LDA: Linear Discriminant Analysis (线性 判别 式 分 析 〉; SVM : Support Vector Machine (支持 向 量 机 ) ， 其 中 SVM-RBF 
是 核 函数 为 高 斯 核 的 支持 向 量 机 ， Linear SVM 为 线性 支持 向 量 机 ; ELM : extreme learning machine (极限 学 习 机 ) ; naive Bayes: 朴素 贝 叶 斯 ;，decision tree: 决策 树 ; KNN :  k-Nearest 
Neighbor ( k 最 近邻 ;; GNB: Gaussian Naive Bayes (高 斯 朴素 贝 叶 斯 ) ; MKL: Multiple Kernel Learning 〈 多 核 学 习 算 法 ) ; Elastic Net Regularization : 弹性 网 络 正 则 化 ， Enet-TV : 
ElasticNet-Total Variation ; LO-norm Regularization: LO-norm 正则 化 ”RDA : Regularized Discriminant function Analysis 《正则 化 判别 函数 分 析 》; GPC : Gaussian Process Classifier (高 斯 过 程 分 类 器 〉; 
RF: Random Forests (随机 森林 ) ; LR: Logistic Regressions Z$ E4) ， 其 中 ， Lasso LR 为 Lasso 回归 ， Ridge LR 为 岭 回 归 ; SVM-RFE : Support Vector Machine-Recursive Feature Elimination 
(基于 支持 向 量 机 的 递归 特征 消除 方法 ) ; DART: Danish Adult Reading Test; WAIS III: Wechsler Adult Intelligence Scale III ， 韦 氏 成 人 智力 量 表 第 三 版 ; MLDA : Maximum Uncertainty Linear 


Discriminant Analysis ; PCA : Principal Component Analysis 〈 主 成 分 分 析 ) ; ACO: ant colony optimization 〈 蚁 群 优化 ) ; schizo-obsessive: 伴随 强迫 症状 的 精神 分 裂 症 ; cognitive deficit subtype : #4 
神 分 裂 症 的 认 知 缺陷 亚 型 ， cognitively spared subtype : 精神 分 裂 症 的 认 知 正常 亚 型 
a : 文章 中 没有 明确 给 出 正确 率 
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Abstract: Machine learning is a promising approach for mental disorders. In recent 
years, machine learning based on T1 weighted imaging and Diffusion Tensor 
Imaging (DTI) data has been used to investigate the psychopathology and underlying 
mechanisms of schizophrenia patients and high-risk population. The findings from 
the previous literature suggest that structural features of frontal lobe and temporal 
lobe can improve classification performance. In addition, the combination of 
behavioural performances and the features of brain structure is superior to the single- 
modality structural images on classification accuracy. However, the existing 
empirical studies classifying schizophrenia patients or high-risk population from 
controls are limited in sample size and generalization ability. 
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